import pandas as pd

def check_name_columns():
    """检查钉钉表中的姓名数据分布"""
    
    # 读取钉钉文件
    file_path = "d:/pycode/ding/宸著锦庭6月考勤.xlsx"
    df = pd.read_excel(file_path, skiprows=2)
    
    print("钉钉表各列的前10行数据:")
    print("="*60)
    
    for i, col in enumerate(df.columns[:10]):  # 只看前10列
        print(f"\n列{i}: {col}")
        print("-" * 30)
        sample_data = df[col].dropna().head(10)
        for j, val in enumerate(sample_data):
            print(f"  {j+1}: {val}")
        
        # 检查是否包含中文姓名
        chinese_names = []
        for val in sample_data:
            val_str = str(val)
            # 检查是否是2-4个中文字符（典型的中文姓名）
            if 2 <= len(val_str) <= 4 and all('\u4e00' <= char <= '\u9fff' for char in val_str):
                chinese_names.append(val_str)
        
        if chinese_names:
            print(f"  >>> 发现可能的中文姓名: {chinese_names}")
    
    # 也检查工资表中的姓名
    print("\n\n工资表中的姓名列数据:")
    print("="*60)
    salary_df = pd.read_excel("d:/pycode/工资表.xlsx")
    name_col = '姓名'
    if name_col in salary_df.columns:
        names = salary_df[name_col].dropna().head(20)
        print(f"工资表姓名样本: {list(names)}")

if __name__ == "__main__":
    check_name_columns()